AI资讯新闻榜单内容搜索- DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  DeepSeek
DeepSeek R1 Zero中文复现教程来了!

DeepSeek R1 Zero中文复现教程来了!

DeepSeek R1 Zero中文复现教程来了!

各位同学好,我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论,我们(Datawhale X 似然实验室)使用 3 张 A800(80G) 计算卡,花了 20 小时训练时间,做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本,我们把它叫做 Datawhale-R1,用于 R1 Zero 复现教学。

来自主题: AI技术研报
9489 点击    2025-02-07 17:54
自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。

来自主题: AI资讯
6696 点击    2025-02-05 16:33
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

过年这几天,DeepSeek 算是彻底破圈了,火遍大江南北,火到人尽皆知。虽然网络版和 APP 版已经足够好用,但把模型部署到本地,才能真正实现独家定制,让 DeepSeek R1 的深度思考「以你为主,为你所用」。

来自主题: AI技术研报
7351 点击    2025-02-04 19:57
Lex Fridman 五小时播客实录:中美 AI 竞争与国运

Lex Fridman 五小时播客实录:中美 AI 竞争与国运

Lex Fridman 五小时播客实录:中美 AI 竞争与国运

在这个对谈中,Lex Fridman 与半导体分析专家 Dylan Patel(SemiAnalysis 创始人)和人工智能研究科学家 Nathan Lambert(艾伦人工智能研究所)展开对话,深入探讨 DeepSeek AI 及其开源模型 V3 和 R1,以及由此引发的 AI 发展地缘政治竞争,特别是中美在 AI 芯片和技术出口管制领域的博弈。   

来自主题: AI资讯
8460 点击    2025-02-04 18:53
进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

春节假期未过半,DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。 今天一觉醒来, DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录,开发人员可以快速地进行实验、迭代,并将这款热门模型集成到他们的工作流程中。

来自主题: AI资讯
8408 点击    2025-02-01 18:54
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。

来自主题: AI资讯
7114 点击    2025-01-30 14:58
最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

“欧洲版 OpenAI” Mistral 的代码模型 CodeStral,又上新了! 而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐,共同位列 Copilot 竞技场第一名。

来自主题: AI资讯
8277 点击    2025-01-14 15:42
超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,技术文档PDF全公开

超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,技术文档PDF全公开

超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,技术文档PDF全公开

在 2024 年底,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了最新的混合专家(MoE)语言模型 DeepSeek-V3-Base。虽然,目前没有放出详细的模型卡,但官方开源了V3的技术文档PDF。

来自主题: AI资讯
8656 点击    2024-12-27 14:35
Janus:DeepSeek 打造的多模态理解与生成的解耦视觉编码框架

Janus:DeepSeek 打造的多模态理解与生成的解耦视觉编码框架

Janus:DeepSeek 打造的多模态理解与生成的解耦视觉编码框架

Janus 是 DeepSeek AI 开发的一个先进的多模态理解和生成框架,它通过创新性地解耦视觉编码路径来应对多模态理解和生成任务之间的需求冲突。

来自主题: AI技术研报
8283 点击    2024-10-29 14:46
解读大模型价格战:着急的大厂,「不太慌」的模型厂商和创业者

解读大模型价格战:着急的大厂,「不太慌」的模型厂商和创业者

解读大模型价格战:着急的大厂,「不太慌」的模型厂商和创业者

自 5 月 6 日 DeepSeek 提出降价、实现百万 Tokens 输入 1 元开始,字节、智谱、阿里、百度、讯飞、腾讯等也先后加入到降价浪潮中。到 5 月 22 日,ERNIE Speed、ERNIE Lite、讯飞星火 Lite、混元-lite 模型等均已实现限定条件下免费。

来自主题: AI资讯
9633 点击    2024-05-27 09:21